AlphaGo Zero

אלפא גו זירו
AlphaGo Zero
מפתח DeepMind עריכת הנתון בוויקינתונים
מחזור חיים 19 באוקטובר 2017 – הווה (6 שנים)
לעריכה בוויקינתונים שמשמש מקור לחלק מהמידע בתבנית
שולחן מסורתי של המשחק גו

AlphaGo Zero היא גרסה מתקדמת של תוכנת AlphaGo למשחק הגו שפותחה על ידי חברת DeepMind. בשונה מגרסאות קודמות, AlphaGo Zero אומנה ללא שימוש בנתוני משחקים של בני אדם, והצליחה להגיע לרמה גבוהה יותר מכל גרסה קודמת.

במאמר שפורסם בכתב העת Nature באוקטובר 2017, תיאר הצוות של DeepMind את תהליך האימון שעברה AlphaGo Zero: בשלושת הימים הראשונים היא הפסידה 100 משחקים לעצמה, ולאחר 21 יום הגיעה לרמת המשחק של AlphaGo Master. תוך 40 ימים נוספים היא עברה כל גרסה קודמת של AlphaGo.[1]

שיטת האימון העצמי הזו, ללא נתוני משחקים אנושיים, יכולה להוביל לפריצות דרך בפיתוח בינה מלאכותית עם יכולות על-אנושיות. מייסד DeepMind, דמיס הסביס, אמר שמה שהוכיחה AlphaGo Zero שהיא אינה מוגבלת עוד על ידי הידע האנושי.

בהמשך פותחה גרסה כללית יותר, AlphaZero, שמסוגלת לשחק גם שחמט ושוגי ברמה גבוהה. AlphaZero הצליחה לנצח גרסאות קודמות של AlphaGo, וכן תוכנות מובילות בשחמט ובשוגי.

היכולת לאמן בינה מלאכותית ללא נתונים אנושיים עשויה להוביל להתקדמות משמעותית בתחום.

לוח גו

From Wikipedia, the free encyclopedia · View on Wikipedia

Developed by Tubidy